Telegram Group & Telegram Channel
πŸ”₯ Π—Π°Π΄Π°Ρ‡Π°: "ДинамичСская пСрСобучаСмая модСль с ограничСниями Π΄Π°Π½Π½Ρ‹Ρ…"

β–ͺ️ УсловиС Π·Π°Π΄Π°Ρ‡ΠΈ:


Π’Π°ΠΌ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ систСму машинного обучСния для ΠΎΠ½Π»Π°ΠΉΠ½-Ρ€Π΅ΠΊΠΎΠΌΠ΅Π½Π΄Π°Ρ†ΠΈΠΉ, которая Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ Π² Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠΌ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ. Π”Π°Π½Π½Ρ‹Π΅ ΠΏΠΎΡΡ‚ΡƒΠΏΠ°ΡŽΡ‚ Π½Π΅ΠΏΡ€Π΅Ρ€Ρ‹Π²Π½Ρ‹ΠΌ ΠΏΠΎΡ‚ΠΎΠΊΠΎΠΌ Π² Π²ΠΈΠ΄Π΅ ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΡΠΊΠΈΡ… дСйствий.

Π”Π°Π½ΠΎ:

- ΠŸΠΎΡ‚ΠΎΠΊ событий Π²ΠΈΠ΄Π°:

{
"user_id": "string",
"event_type": "click" | "view" | "purchase",
"item_id": "string",
"timestamp": "ISO 8601",
"features": {
"device_type": "mobile" | "desktop",
"location": "string",
"time_of_day": "morning" | "afternoon" | "evening" | "night",
"category": "string"
}
}


ВрСбования:

1. ΠŸΠΎΡΡ‚Ρ€ΠΎΠΈΡ‚ΡŒ модСль, которая:
- ΠŸΡ€Π΅Π΄ΡΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ ΠΏΠΎΠΊΡƒΠΏΠΊΠΈ (`purchase`) ΠΏΠΎ ΡΠΎΠ±Ρ‹Ρ‚ΠΈΡŽ view.
- МодСль Π΄ΠΎΠ»ΠΆΠ½Π° динамичСски ΠΎΠ±Π½ΠΎΠ²Π»ΡΡ‚ΡŒΡΡ ΠΏΡ€ΠΈ поступлСнии Π½ΠΎΠ²Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… Π±Π΅Π· ΠΏΠΎΠ»Π½ΠΎΠ³ΠΎ пСрСобучСния с нуля.
- ΠŸΡ€ΠΈ этом историчСскиС Π΄Π°Π½Π½Ρ‹Π΅ ΡƒΠ΄Π°Π»ΡΡŽΡ‚ΡΡ Ρ‡Π΅Ρ€Π΅Π· 24 часа (Π΄Π°Π½Π½Ρ‹Π΅ "ΠΆΠΈΠ²ΡƒΡ‚" Ρ‚ΠΎΠ»ΡŒΠΊΠΎ сутки).

2. Π’Π½Π΅Π΄Ρ€ΠΈΡ‚ΡŒ ΠΌΠ΅Ρ…Π°Π½ΠΈΠ·ΠΌ:
- ΠžΠ±Π½Π°Ρ€ΡƒΠΆΠ΅Π½ΠΈΡ Π΄Ρ€Π΅ΠΉΡ„Π° Π΄Π°Π½Π½Ρ‹Ρ… Π±Π΅Π· доступа ΠΊ старым Π΄Π°Π½Π½Ρ‹ΠΌ.
- АвтоматичСского пСрСзапуска пСрСобучСния ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΏΡ€ΠΈ ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠ΅Π½ΠΈΠΈ сущСствСнного Π΄Ρ€Π΅ΠΉΡ„Π°.

3. ΠžΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½ΠΈΡ:
- Π’Ρ‹ Π½Π΅ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ Ρ…Ρ€Π°Π½ΠΈΡ‚ΡŒ Π±ΠΎΠ»Π΅Π΅ 1 ΠΌΠΈΠ»Π»ΠΈΠΎΠ½Π° событий Π² ΠΎΠΏΠ΅Ρ€Π°Ρ‚ΠΈΠ²Π½ΠΎΠΉ памяти.
- Latency прСдсказания ΠΌΠΎΠ΄Π΅Π»ΠΈ β€” Π½Π΅ Π±ΠΎΠ»Π΅Π΅ 100 миллисСкунд.

---

β–ͺ️ ## Подсказки:

- ΠŸΠΎΠ΄ΡƒΠΌΠ°ΠΉΡ‚Π΅ ΠΏΡ€ΠΎ использованиС on-line learning ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, SGDClassifier с partial_fit Π² sklearn, ΠΈΠ»ΠΈ свои Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ).
- Для отслСТивания Π΄Ρ€Π΅ΠΉΡ„Π° Π±Π΅Π· хранСния ΠΏΠΎΠ»Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… ΠΌΠΎΠΆΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ:
- Бтатистики ΠΏΠΎ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠ°ΠΌ (ΡΠΊΠΎΠ»ΡŒΠ·ΡΡ‰ΠΈΠ΅ ΠΎΠΊΠ½Π°, гистограммы, PSI / KL-Π΄ΠΈΠ²Π΅Ρ€Π³Π΅Π½Ρ†ΠΈΡŽ).
- ΠœΠΎΠ½ΠΈΡ‚ΠΎΡ€ΠΈΠ½Π³ распрСдСлСний Ρ‡Π΅Ρ€Π΅Π· ΡΠΊΠΎΠ»ΡŒΠ·ΡΡ‰ΠΈΠ΅ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ.
- Для Ρ€Π°Π±ΠΎΡ‚Ρ‹ Π² Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠΌ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ ΠΏΠΎΠ΄ΡƒΠΌΠ°ΠΉΡ‚Π΅ ΠΎΠ± очСрСдях сообщСний ΠΈ микросСрвисной Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Π΅.
- Π’ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ, стоит Ρ€Π°ΡΡΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ feature hashing для ΠΊΠ°Ρ‚Π΅Π³ΠΎΡ€ΠΈΠ°Π»ΡŒΠ½Ρ‹Ρ… ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ², Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡ΠΈΡ‚ΡŒ Ρ€Π°Π·ΠΌΠ΅Ρ€ пространства ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ².

---

β–ͺ️ ## Π§Ρ‚ΠΎ оцСниваСтся:

- Π£ΠΌΠ΅Π½ΠΈΠ΅ Π²Ρ‹Π±ΠΈΡ€Π°Ρ‚ΡŒ ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½Ρ‹Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΈ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ обучСния ΠΏΠΎΠ΄ ограничСния Π·Π°Π΄Π°Ρ‡ΠΈ.
- Навыки построСния систСм с ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½ΠΈΠ΅ΠΌ ΠΏΠΎ памяти ΠΈ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ ΠΎΡ‚Π²Π΅Ρ‚Π°.
- Π‘ΠΏΠΎΡΠΎΠ±Π½ΠΎΡΡ‚ΡŒ Π΄Π΅Ρ‚Π΅ΠΊΡ‚ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π΄Ρ€Π΅ΠΉΡ„ Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ ΠΊΠΎΡ€Ρ€Π΅ΠΊΡ‚Π½ΠΎ Π½Π° Π½Π΅Π³ΠΎ Ρ€Π΅Π°Π³ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ.
- Чистота ΠΈ ΠΌΠ°ΡΡˆΡ‚Π°Π±ΠΈΡ€ΡƒΠ΅ΠΌΠΎΡΡ‚ΡŒ Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Ρ‹.
- ПониманиС особСнностСй ΠΏΡ€ΠΎΠ΄Π°ΠΊΡˆΠ½-ML систСм.

---

β–ͺ️ ## Π Π°Π·Π±ΠΎΡ€ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΠ³ΠΎ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ:

**АрхитСктура Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ:**

- Π˜ΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ ΠΎΠ½Π»Π°ΠΉΠ½-модСль (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, SGDClassifier, Vowpal Wabbit, ΠΈΠ»ΠΈ свою Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΡŽ логистичСской рСгрСссии).
- Для ΠΊΠ°Ρ‚Π΅Π³ΠΎΡ€ΠΈΠ°Π»ΡŒΠ½Ρ‹Ρ… ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡ‚ΡŒ feature hashing (Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΈΠ·Π±Π΅ΠΆΠ°Ρ‚ΡŒ роста количСства ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ²).
- ΠŸΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΈΠ²Π°Ρ‚ΡŒ "ΠΆΠΈΠ²ΠΎΠΉ" Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½Ρ‹ΠΉ Π±ΡƒΡ„Π΅Ρ€ Π² ΠΎΠΏΠ΅Ρ€Π°Ρ‚ΠΈΠ²Π½ΠΎΠΉ памяти:
- Π₯Ρ€Π°Π½ΠΈΡ‚ΡŒ послСдниС N событий (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, 1 ΠΌΠΈΠ»Π»ΠΈΠΎΠ½) с рСгулярным ΡƒΠ΄Π°Π»Π΅Π½ΠΈΠ΅ΠΌ ΡƒΡΡ‚Π°Ρ€Π΅Π²ΡˆΠΈΡ… записСй (TTL).
- Для отслСТивания Π΄Ρ€Π΅ΠΉΡ„Π°:
- Π‘Π»Π΅Π΄ΠΈΡ‚ΡŒ Π·Π° срСдними значСниями ΠΈΠ»ΠΈ частотами ΠΊΠ°Ρ‚Π΅Π³ΠΎΡ€ΠΈΠΉ.
- ΠŸΡ€ΠΈ Ρ€Π΅Π·ΠΊΠΈΡ… измСнСниях β€” Ρ‚Ρ€ΠΈΠ³Π³Π΅Ρ€ΠΈΡ‚ΡŒ ΠΏΠ΅Ρ€Π΅ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ с нуля.

ΠŸΡ€ΠΎ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹Π΅ слоТности:

- ΠžΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠ° "Ρ…ΠΎΠ»ΠΎΠ΄Π½ΠΎΠ³ΠΎ старта" ΠΏΡ€ΠΈ ΠΈΠ½ΠΈΡ†ΠΈΠ°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ Π½ΠΎΠ²ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ Π±Π΅Π· большого объСма Π΄Π°Π½Π½Ρ‹Ρ….
- Как ΠΈΠ·Π±Π΅ΠΆΠ°Ρ‚ΡŒ пСрСобучСния Π½Π° ΡˆΡƒΠΌ ΠΏΡ€ΠΈ частом ΠΏΠ΅Ρ€Π΅ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈ.
- Баланс ΠΌΠ΅ΠΆΠ΄Ρƒ ΡΠΊΠΎΡ€ΠΎΡΡ‚ΡŒΡŽ Ρ€Π°Π±ΠΎΡ‚Ρ‹ ΠΈ качСством ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΏΡ€ΠΈ ΠΎΡ‡Π΅Π½ΡŒ частом ΠΎΠ±Π½ΠΎΠ²Π»Π΅Π½ΠΈΠΈ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ².

Π˜Π½ΡΡ‚Ρ€ΡƒΠΌΠ΅Π½Ρ‚Ρ‹, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΌΠΎΠ³ΡƒΡ‚ ΠΏΠΎΠΌΠΎΡ‡ΡŒ:

- Π‘ΠΊΠΎΠ»ΡŒΠ·ΡΡ‰ΠΈΠ΅ гистограммы для ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² (`histogram_sketching`).
- Feature hashing (`HashingVectorizer`, `FeatureHasher`).
- ΠœΠ΅Ρ…Π°Π½ΠΈΠ·ΠΌΡ‹ ΠΈΠ½ΠΊΡ€Π΅ΠΌΠ΅Π½Ρ‚Π°Π»ΡŒΠ½ΠΎΠ³ΠΎ обучСния (`partial_fit`, warm_start ΠΌΠΎΠ΄Π΅Π»ΠΈ).
- ΠœΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ для ΠΌΠΎΠ½ΠΈΡ‚ΠΎΡ€ΠΈΠ½Π³Π° Π΄Ρ€Π΅ΠΉΡ„Π°: Population Stability Index (PSI), JS/ KL дивСргСнция.

Π”Π΅Π»ΠΈΡ‚Π΅ΡΡŒ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ΠΌ Π² коммСнтариях πŸ‘‡

@machinelearning_interview

#собСсСдованиС #Π·Π°Π΄Π°Ρ‡Π° #ΠΌΠ°ΡˆΠΈΠ½Π½ΠΎΠ΅ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅
Please open Telegram to view this post
VIEW IN TELEGRAM



tg-me.com/machinelearning_interview/1772
Create:
Last Update:

πŸ”₯ Π—Π°Π΄Π°Ρ‡Π°: "ДинамичСская пСрСобучаСмая модСль с ограничСниями Π΄Π°Π½Π½Ρ‹Ρ…"

β–ͺ️ УсловиС Π·Π°Π΄Π°Ρ‡ΠΈ:


Π’Π°ΠΌ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ систСму машинного обучСния для ΠΎΠ½Π»Π°ΠΉΠ½-Ρ€Π΅ΠΊΠΎΠΌΠ΅Π½Π΄Π°Ρ†ΠΈΠΉ, которая Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ Π² Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠΌ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ. Π”Π°Π½Π½Ρ‹Π΅ ΠΏΠΎΡΡ‚ΡƒΠΏΠ°ΡŽΡ‚ Π½Π΅ΠΏΡ€Π΅Ρ€Ρ‹Π²Π½Ρ‹ΠΌ ΠΏΠΎΡ‚ΠΎΠΊΠΎΠΌ Π² Π²ΠΈΠ΄Π΅ ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΡΠΊΠΈΡ… дСйствий.

Π”Π°Π½ΠΎ:

- ΠŸΠΎΡ‚ΠΎΠΊ событий Π²ΠΈΠ΄Π°:


{
"user_id": "string",
"event_type": "click" | "view" | "purchase",
"item_id": "string",
"timestamp": "ISO 8601",
"features": {
"device_type": "mobile" | "desktop",
"location": "string",
"time_of_day": "morning" | "afternoon" | "evening" | "night",
"category": "string"
}
}


ВрСбования:

1. ΠŸΠΎΡΡ‚Ρ€ΠΎΠΈΡ‚ΡŒ модСль, которая:
- ΠŸΡ€Π΅Π΄ΡΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ ΠΏΠΎΠΊΡƒΠΏΠΊΠΈ (`purchase`) ΠΏΠΎ ΡΠΎΠ±Ρ‹Ρ‚ΠΈΡŽ view.
- МодСль Π΄ΠΎΠ»ΠΆΠ½Π° динамичСски ΠΎΠ±Π½ΠΎΠ²Π»ΡΡ‚ΡŒΡΡ ΠΏΡ€ΠΈ поступлСнии Π½ΠΎΠ²Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… Π±Π΅Π· ΠΏΠΎΠ»Π½ΠΎΠ³ΠΎ пСрСобучСния с нуля.
- ΠŸΡ€ΠΈ этом историчСскиС Π΄Π°Π½Π½Ρ‹Π΅ ΡƒΠ΄Π°Π»ΡΡŽΡ‚ΡΡ Ρ‡Π΅Ρ€Π΅Π· 24 часа (Π΄Π°Π½Π½Ρ‹Π΅ "ΠΆΠΈΠ²ΡƒΡ‚" Ρ‚ΠΎΠ»ΡŒΠΊΠΎ сутки).

2. Π’Π½Π΅Π΄Ρ€ΠΈΡ‚ΡŒ ΠΌΠ΅Ρ…Π°Π½ΠΈΠ·ΠΌ:
- ΠžΠ±Π½Π°Ρ€ΡƒΠΆΠ΅Π½ΠΈΡ Π΄Ρ€Π΅ΠΉΡ„Π° Π΄Π°Π½Π½Ρ‹Ρ… Π±Π΅Π· доступа ΠΊ старым Π΄Π°Π½Π½Ρ‹ΠΌ.
- АвтоматичСского пСрСзапуска пСрСобучСния ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΏΡ€ΠΈ ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠ΅Π½ΠΈΠΈ сущСствСнного Π΄Ρ€Π΅ΠΉΡ„Π°.

3. ΠžΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½ΠΈΡ:
- Π’Ρ‹ Π½Π΅ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ Ρ…Ρ€Π°Π½ΠΈΡ‚ΡŒ Π±ΠΎΠ»Π΅Π΅ 1 ΠΌΠΈΠ»Π»ΠΈΠΎΠ½Π° событий Π² ΠΎΠΏΠ΅Ρ€Π°Ρ‚ΠΈΠ²Π½ΠΎΠΉ памяти.
- Latency прСдсказания ΠΌΠΎΠ΄Π΅Π»ΠΈ β€” Π½Π΅ Π±ΠΎΠ»Π΅Π΅ 100 миллисСкунд.

---

β–ͺ️ ## Подсказки:

- ΠŸΠΎΠ΄ΡƒΠΌΠ°ΠΉΡ‚Π΅ ΠΏΡ€ΠΎ использованиС on-line learning ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, SGDClassifier с partial_fit Π² sklearn, ΠΈΠ»ΠΈ свои Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ).
- Для отслСТивания Π΄Ρ€Π΅ΠΉΡ„Π° Π±Π΅Π· хранСния ΠΏΠΎΠ»Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… ΠΌΠΎΠΆΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ:
- Бтатистики ΠΏΠΎ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠ°ΠΌ (ΡΠΊΠΎΠ»ΡŒΠ·ΡΡ‰ΠΈΠ΅ ΠΎΠΊΠ½Π°, гистограммы, PSI / KL-Π΄ΠΈΠ²Π΅Ρ€Π³Π΅Π½Ρ†ΠΈΡŽ).
- ΠœΠΎΠ½ΠΈΡ‚ΠΎΡ€ΠΈΠ½Π³ распрСдСлСний Ρ‡Π΅Ρ€Π΅Π· ΡΠΊΠΎΠ»ΡŒΠ·ΡΡ‰ΠΈΠ΅ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ.
- Для Ρ€Π°Π±ΠΎΡ‚Ρ‹ Π² Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠΌ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ ΠΏΠΎΠ΄ΡƒΠΌΠ°ΠΉΡ‚Π΅ ΠΎΠ± очСрСдях сообщСний ΠΈ микросСрвисной Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Π΅.
- Π’ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ, стоит Ρ€Π°ΡΡΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ feature hashing для ΠΊΠ°Ρ‚Π΅Π³ΠΎΡ€ΠΈΠ°Π»ΡŒΠ½Ρ‹Ρ… ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ², Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡ΠΈΡ‚ΡŒ Ρ€Π°Π·ΠΌΠ΅Ρ€ пространства ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ².

---

β–ͺ️ ## Π§Ρ‚ΠΎ оцСниваСтся:

- Π£ΠΌΠ΅Π½ΠΈΠ΅ Π²Ρ‹Π±ΠΈΡ€Π°Ρ‚ΡŒ ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½Ρ‹Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΈ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ обучСния ΠΏΠΎΠ΄ ограничСния Π·Π°Π΄Π°Ρ‡ΠΈ.
- Навыки построСния систСм с ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½ΠΈΠ΅ΠΌ ΠΏΠΎ памяти ΠΈ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ ΠΎΡ‚Π²Π΅Ρ‚Π°.
- Π‘ΠΏΠΎΡΠΎΠ±Π½ΠΎΡΡ‚ΡŒ Π΄Π΅Ρ‚Π΅ΠΊΡ‚ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π΄Ρ€Π΅ΠΉΡ„ Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ ΠΊΠΎΡ€Ρ€Π΅ΠΊΡ‚Π½ΠΎ Π½Π° Π½Π΅Π³ΠΎ Ρ€Π΅Π°Π³ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ.
- Чистота ΠΈ ΠΌΠ°ΡΡˆΡ‚Π°Π±ΠΈΡ€ΡƒΠ΅ΠΌΠΎΡΡ‚ΡŒ Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Ρ‹.
- ПониманиС особСнностСй ΠΏΡ€ΠΎΠ΄Π°ΠΊΡˆΠ½-ML систСм.

---

β–ͺ️ ## Π Π°Π·Π±ΠΎΡ€ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΠ³ΠΎ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ:

**АрхитСктура Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ:**

- Π˜ΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ ΠΎΠ½Π»Π°ΠΉΠ½-модСль (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, SGDClassifier, Vowpal Wabbit, ΠΈΠ»ΠΈ свою Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΡŽ логистичСской рСгрСссии).
- Для ΠΊΠ°Ρ‚Π΅Π³ΠΎΡ€ΠΈΠ°Π»ΡŒΠ½Ρ‹Ρ… ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡ‚ΡŒ feature hashing (Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΈΠ·Π±Π΅ΠΆΠ°Ρ‚ΡŒ роста количСства ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ²).
- ΠŸΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΈΠ²Π°Ρ‚ΡŒ "ΠΆΠΈΠ²ΠΎΠΉ" Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½Ρ‹ΠΉ Π±ΡƒΡ„Π΅Ρ€ Π² ΠΎΠΏΠ΅Ρ€Π°Ρ‚ΠΈΠ²Π½ΠΎΠΉ памяти:
- Π₯Ρ€Π°Π½ΠΈΡ‚ΡŒ послСдниС N событий (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, 1 ΠΌΠΈΠ»Π»ΠΈΠΎΠ½) с рСгулярным ΡƒΠ΄Π°Π»Π΅Π½ΠΈΠ΅ΠΌ ΡƒΡΡ‚Π°Ρ€Π΅Π²ΡˆΠΈΡ… записСй (TTL).
- Для отслСТивания Π΄Ρ€Π΅ΠΉΡ„Π°:
- Π‘Π»Π΅Π΄ΠΈΡ‚ΡŒ Π·Π° срСдними значСниями ΠΈΠ»ΠΈ частотами ΠΊΠ°Ρ‚Π΅Π³ΠΎΡ€ΠΈΠΉ.
- ΠŸΡ€ΠΈ Ρ€Π΅Π·ΠΊΠΈΡ… измСнСниях β€” Ρ‚Ρ€ΠΈΠ³Π³Π΅Ρ€ΠΈΡ‚ΡŒ ΠΏΠ΅Ρ€Π΅ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ с нуля.

ΠŸΡ€ΠΎ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹Π΅ слоТности:

- ΠžΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠ° "Ρ…ΠΎΠ»ΠΎΠ΄Π½ΠΎΠ³ΠΎ старта" ΠΏΡ€ΠΈ ΠΈΠ½ΠΈΡ†ΠΈΠ°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ Π½ΠΎΠ²ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ Π±Π΅Π· большого объСма Π΄Π°Π½Π½Ρ‹Ρ….
- Как ΠΈΠ·Π±Π΅ΠΆΠ°Ρ‚ΡŒ пСрСобучСния Π½Π° ΡˆΡƒΠΌ ΠΏΡ€ΠΈ частом ΠΏΠ΅Ρ€Π΅ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈ.
- Баланс ΠΌΠ΅ΠΆΠ΄Ρƒ ΡΠΊΠΎΡ€ΠΎΡΡ‚ΡŒΡŽ Ρ€Π°Π±ΠΎΡ‚Ρ‹ ΠΈ качСством ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΏΡ€ΠΈ ΠΎΡ‡Π΅Π½ΡŒ частом ΠΎΠ±Π½ΠΎΠ²Π»Π΅Π½ΠΈΠΈ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ².

Π˜Π½ΡΡ‚Ρ€ΡƒΠΌΠ΅Π½Ρ‚Ρ‹, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΌΠΎΠ³ΡƒΡ‚ ΠΏΠΎΠΌΠΎΡ‡ΡŒ:

- Π‘ΠΊΠΎΠ»ΡŒΠ·ΡΡ‰ΠΈΠ΅ гистограммы для ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² (`histogram_sketching`).
- Feature hashing (`HashingVectorizer`, `FeatureHasher`).
- ΠœΠ΅Ρ…Π°Π½ΠΈΠ·ΠΌΡ‹ ΠΈΠ½ΠΊΡ€Π΅ΠΌΠ΅Π½Ρ‚Π°Π»ΡŒΠ½ΠΎΠ³ΠΎ обучСния (`partial_fit`, warm_start ΠΌΠΎΠ΄Π΅Π»ΠΈ).
- ΠœΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ для ΠΌΠΎΠ½ΠΈΡ‚ΠΎΡ€ΠΈΠ½Π³Π° Π΄Ρ€Π΅ΠΉΡ„Π°: Population Stability Index (PSI), JS/ KL дивСргСнция.

Π”Π΅Π»ΠΈΡ‚Π΅ΡΡŒ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ΠΌ Π² коммСнтариях πŸ‘‡

@machinelearning_interview

#собСсСдованиС #Π·Π°Π΄Π°Ρ‡Π° #ΠΌΠ°ΡˆΠΈΠ½Π½ΠΎΠ΅ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

BY Machine learning Interview


Warning: Undefined variable $i in /var/www/tg-me/post.php on line 283

Share with your friend now:
tg-me.com/machinelearning_interview/1772

View MORE
Open in Telegram


Machine learning Interview Telegram | DID YOU KNOW?

Date: |

What is Telegram?

Telegram is a cloud-based instant messaging service that has been making rounds as a popular option for those who wish to keep their messages secure. Telegram boasts a collection of different features, but it’s best known for its ability to secure messages and media by encrypting them during transit; this prevents third-parties from snooping on messages easily. Let’s take a look at what Telegram can do and why you might want to use it.

Look for Channels Online

You guessed it – the internet is your friend. A good place to start looking for Telegram channels is Reddit. This is one of the biggest sites on the internet, with millions of communities, including those from Telegram.Then, you can search one of the many dedicated websites for Telegram channel searching. One of them is telegram-group.com. This website has many categories and a really simple user interface. Another great site is telegram channels.me. It has even more channels than the previous one, and an even better user experience.These are just some of the many available websites. You can look them up online if you’re not satisfied with these two. All of these sites list only public channels. If you want to join a private channel, you’ll have to ask one of its members to invite you.

Machine learning Interview from sg


Telegram Machine learning Interview
FROM USA